P2-7 事前学習モデルを活用したEnd-to-end型動画キーフレーム物語生成法
動画キーフレーム物語生成タスク
CLIP使ってる